最近已将基于学习的THZ多层成像用于非接触式三维(3D)定位和编码。我们通过实验验证,展示了新兴量子机学习(QML)框架的概念验证演示,以应对深度变化,阴影效应和双面内容识别。
translated by 谷歌翻译
In this paper, we propose a control synthesis method for signal temporal logic (STL) specifications with neural networks (NNs). Most of the previous works consider training a controller for only a given STL specification. These approaches, however, require retraining the NN controller if a new specification arises and needs to be satisfied, which results in large consumption of memory and inefficient training. To tackle this problem, we propose to construct NN controllers by introducing encoder-decoder structured NNs with an attention mechanism. The encoder takes an STL formula as input and encodes it into an appropriate vector, and the decoder outputs control signals that will meet the given specification. As the encoder, we consider three NN structures: sequential, tree-structured, and graph-structured NNs. All the model parameters are trained in an end-to-end manner to maximize the expected robustness that is known to be a quantitative semantics of STL formulae. We compare the control performances attained by the above NN structures through a numerical experiment of the path planning problem, showing the efficacy of the proposed approach.
translated by 谷歌翻译
马尔可夫链蒙特卡洛(MCMC),例如langevin Dynamics,有效地近似顽固的分布。但是,由于昂贵的数据采样迭代和缓慢的收敛性,它的用法在深层可变模型的背景下受到限制。本文提出了摊销的langevin Dynamics(ALD),其中数据划分的MCMC迭代完全被编码器的更新替换为将观测值映射到潜在变量中。这种摊销可实现有效的后验采样,而无需数据迭代。尽管具有效率,但我们证明ALD是MCMC算法有效的,其马尔可夫链在轻度假设下将目标后部作为固定分布。基于ALD,我们还提出了一个名为Langevin AutoCodeer(LAE)的新的深层变量模型。有趣的是,可以通过稍微修改传统自动编码器来实现LAE。使用多个合成数据集,我们首先验证ALD可以从目标后代正确获取样品。我们还在图像生成任务上评估了LAE,并证明我们的LAE可以根据变异推断(例如变异自动编码器)和其他基于MCMC的方法在测试可能性方面胜过现有的方法。
translated by 谷歌翻译
我们研究了用于解决条件随机优化问题的随机梯度下降,其中要最小化的目标是通过参数嵌套期望给出的,相对于一个随机变量,与另一个随机变量相对于一个随机变量和内部条件期望进行了外部期望。这种参数嵌套期望的梯度再次表示为嵌套期望,这使得标准嵌套的蒙特卡洛估计量很难公正。在本文中,我们在某些条件下表明,多级蒙特卡洛梯度估计器是公正的,并且具有有限的方差和有限的预期计算成本,因此直接适用了参数(非嵌套)期望的随机优化的标准理论。我们还讨论了一个特殊情况,可以为此构建另一个具有有限差异和成本的公正梯度估计器。
translated by 谷歌翻译
有效推论是一种数学框架,它起源于计算神经科学,作为大脑如何实现动作,感知和学习的理论。最近,已被证明是在不确定性下存在国家估算和控制问题的有希望的方法,以及一般的机器人和人工代理人的目标驱动行为的基础。在这里,我们审查了最先进的理论和对国家估计,控制,规划和学习的积极推断的实现;描述当前的成就,特别关注机器人。我们展示了相关实验,以适应,泛化和稳健性而言说明其潜力。此外,我们将这种方法与其他框架联系起来,并讨论其预期的利益和挑战:使用变分贝叶斯推理具有功能生物合理性的统一框架。
translated by 谷歌翻译
本研究旨在解决二次多尺寸机器人到执行器故障的容错问题,这对于在远程或极端环境中运行的机器人至关重要。特别地,建立了具有动态随机化(ACDR)的自适应课程增强学习算法。ACDR算法可以在随机执行器故障条件下自适应地培训四足机器人,并制定一个用于容错机器人控制的单一强大策略。值得注意的是,难以使静止的课程比易于2个课程更有效地用于四足机器人机器人。ACDR算法可用于构建机器人系统,该机器人不需要其他模块检测执行器故障和切换策略。实验结果表明,ACDR算法在平均奖励和步行距离方面优于传统算法。
translated by 谷歌翻译
大脑减轻了对自我产生的遗产的反应(例如,我们不能自我痒痒)。这种现象是这种现象,称为感官衰减,天生,还是通过学习获得的?为了探讨后一种可能性,我们创建了由感官(Proprioceptive和Extleceptive),协会和行政区域组成的神经网络模型。由网络控制的模拟机器人学会了以获得具有自我产生或外部产生的脱敏反馈的电动机图案。我们发现,机器人首先在学习早期阶段的自我产生和外部产生的条件下的感觉和关联区域中的响应增加,但随后,它逐渐衰减在仅用于自我产生的条件的感觉区域中的反应。机器人自发地获得了通过切换执行区域的神经状态的条件来切​​换(衰减或放大)响应的容量。这表明通过学习自动组织网络内部感官信息流的主动控制。我们还发现,调制感官信息流程的天然改变诱导类似于精神分裂症和自闭症谱系疾病的一些特征。本研究提供了一种关于神经机制潜在的感知现象和精神病疾病的新颖性观点。
translated by 谷歌翻译